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摘 要 : 针对 智慧 交通 的 需求 ， 提 出 了 一 种 新 颖 有 效 的 短 时 交通 流 预测 方法 ， 通 过 异常 值 识 别 扩展 了 卡尔 受 滤 波 ， 
使 其 能 对 噪声 进行 识别 和 过 滤 一 一 异常 值 识别 卡尔 曼 滤 波 器 。 利 用 卡尔 曼 滤 波 能 0 统 不 确定 性 的 交 
通 流 波 动 ， 但 这 可 能 会 使 指示 交通 流 突 变 的 细微 线索 丢失 。 为 了 提升 预测 精度 ， 应 用 高 散 小 波 变换 对 原始 信号 进行 
识别 处 理 ， 在 去 掉 异 常 值 的 同时 保留 原 有 对 预测 有 效 的 信号 源 信 息 ， 人 
最 后 ， 在 四 个 基准 数据 集 上 的 大 量 实验 表明 ， 与 常用 及 最 新 的 预测 模型 相 比 ， 其 结果 MAPE 平均 降低 了 2.919%， 
RMSE 平均 降低 了 79.582。 
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Outlier-identified Kalman filter for short-term traffic flow forecasting 


Bai Weihual, Zhang Chuanbin!, Zhang Shuangyi2, Zhou Teng? 
(1. School of Computer Science & Software、 School of Big Data, ZhaoQing University, Zhaoqging Guangdong 526061, China; 
2. Dept. of Computer Science, Shantou University, Shantou Guangdong 515063, China) 


Abstract: A novel and effective technique for short-term traffic flow forecasting is presented. The main contribution is an 
extension of Kalman filter, such that it becomes to be able to identify the outlier and then filter out it; the present technique is 
named as Outlier-identified Kalman filter. The fluctuations of the traffic flow, which leads the system uncertainty, is often 
filtered out by the classic Kalman filter, and the subtle clues indicating the sudden change of the traffic flow may lose in this 
operation. To achieve better forecasting accuracy, discrete wavelet transform is used to process the original signal and the 
useful signals are preserved while de-noising. In addition, historical reference values are applied to correct predicted values. 
Extensive experiments on four benchmark datasets demonstrate an average improvement of 2.919% in MAPE and 79.58 in 
RMSE. 
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0 ”引言 交通 流 预测 模型 和 方法 ， 主 要 包括 线性 理论 模型 、 非 线性 理 
加 论 模型 、 动 态 分 配 模型 及 基于 知识 发 现 的 模型 四 大 类 。 卡 尔 
结合 物 联网 、 车 辆 网 和 智慧 交通 的 应 用 ， 准 确 及 时 的 交 ee filter, KF) 及 其 变 体 由 于 具有 计算 效率 高 ， 
通 流 信 息 对 智能 交通 系统 (intelligent transport system, ITS) 的 所 需 内 存 少 ， 适 用 于 静态 、 非 平稳 数据 分 析 ， 可 使 用 实时 数 
成 功 部 署 至 关 重 要 ， 它 能 为 物流 部 门 、 商 业 机 构 、 旅 游 服务 据 动态 更 新 其 状态 变量 ， 并 能 更 好 地 适应 交通 流量 的 变化 等 
机 构 和 政府 管理 机 构 提供 可 靠 的 交通 流 信 息 :优化 路 线 规 划 、 特性 , 是 交通 流 预 测 任务 中 广泛 使 用 的 强大 工具 之 一 [3。 为 
提高 效率 且 节 约 时 间 ; 缓解 交通 拥堵 ， 降 低 交 通 运 输 成 本 ; 了 解决 交通 流 中 存在 的 高 度 不 确定 性 (气候 、 交 通 事 故 、 突 发 
减少 汽车 尾气 排放 污染 、 节 省 能 源 ;， 减少 交通 事故 ， 并 提高 事件 等 )、 简单 的 噪声 过 滤 预 处 理 对 指示 交通 流 突 变 的 失真 问 
交通 运营 效率 。 题 ， 本 文 提 出 了 一 种 能 够 准确 区 分 有 效 信号 和 噪声 的 卡尔 曼 
为 提升 交通 运输 体系 的 智能 化 水 平 ， 应 用 大 数据 、 移 动 滤波 器 ， 命 名 为 异常 值 识 别 卡尔 曼 滤波 器 (outlier-identified 
互联 网 等 技术 与 交通 运输 深度 融合 ， 交 通 流量 是 判别 道路 交 Kalman filter OiKF)。 本 文 将 OiKF 应 用 于 短期 交通 流 预测 ， 


通 状态 的 一 个 关键 因素 。 短 期 交通 流 预 况 上 的 ， 并 在 四 个 基准 数据 集 上 对 其 进行 了 实验 评估 ， 然 后 与 经 典 的 
与 中 观 和 宏观 意义 上 以 小 时 、 天 、 甚 至 是 年 计算 的 基于 交通 ”卡尔 曼 滤 波 器 以 及 其 他 常用 的 参数 和 非 参 数 技术 进行 性 能 比 
规划 的 战略 预测 有 本 质 区 别 : 其 主要 内 容 是 基于 当前 和 过 去 较 , 经 大 量 实验 证 明 ， 该 技术 提高 了 预测 的 精确 度 和 准确 性 , 证明 
的 交通 数据 ， 采 用 适当 的 方法 去 滚动 预测 未 来 几 秒 到 半 小 时 了 蜡 常 值 识 别 卡 尔 曼 滤波 器 在 短期 交通 流 预测 方面 的 优越 性 。 
的 交通 状况 。 然 而 , 由 于 交通 流 内 在 的 随机 性 和 外 部 噪声 上 3 1 ”相关 研究 
的 存在 ， 比 如 意外 事故 或 人 工交 通 管制 己 1， 找 到 既 稳 健 又 准 
确 的 预测 算法 是 一 项 具有 挑战 性 的 任务 。 传统 的 卡尔 曼 滤波 及 其 变 体 为 分 析 和 人 解决 一 大 类 估计 问 

针对 交通 流 预测 研究 ， 各 国学 者 已 提出 了 300 多 种 短 时  ” 题 提供 了 清晰 强大 的 基本 工具 ,被 广泛 应 用 于 许多 工程 领域 ， 
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特别 是 对 于 离散 时 间 系统 状态 估计 ， 包 括 信号 处 理 ， 最 优 控 ”满足 容许 条 件 (admissibility condition) 即 ; 
制 ， 导 航 等 。 实际 应 用 包括 参数 估计 ,系统 识别 , 目标 跟踪 ， 本 

同步 定位 等 。 这 些 问题 的 很 多 过 程 都 可 以 用 状态 空间 系统 去 c= awe 
描述 ， 如 果 本 文 能 对 一 个 过 程 建立 数学 模型 ， 本 文 就 可 以 利 


用 数学 工具 去 控制 这 个 过 程 ， 并 获得 关于 该 过 程 的 信息 。 利 则 称 函数 y(n 为 小 波 母 函数 ， 对 其 进行 伸缩 和 平移 变换 得 
用 状态 空间 系统 对 短期 交通 流 预 测 问题 进行 建 模 已 有 不 少 1 /ti-b 

. i OT tA dE 
究 。Okutani 和 StephanedesD] 首先 在 城市 交通 量 预测 中 引入 Va \a 
状态 空间 模型 来 预测 高 速 公 路 入 口 坡 道 区 域 的 交通 分 流 ， 其 中 a 为 尺度 参数 ，2 为 平移 参数 ， 若 信号 f (i) 是 一 个 平方 
验证 该 模型 优 于 二 代 城 市 交通 控制 系统 (UTCS-2) 中 使 用 可 积 函 数 ， 即 f(7?) eB(R) ， 则 连续 小 波 变换 的 定义 如 下 : 


交通 量 预测 模型 。 Stathopoulos 和 Karlaftist19 也 提出 了 一 种 
于 最 优 状态 估计 理论 的 模型 ， 并 表明 多 变量 状态 空间 模型 
使 用 提高 了 ARIMA 模型 的 预测 精度 。 Hu 等 人 0 提出 了 混 


Wr (a.b)= |f (DBs (Dada>0dbeR 


其 中 ， Vs) 为 ws 的 共 斩 。 对 尺度 参数 " 和 平移 参数 b 进 


闪 东 于 上 肛 吾 


粒子 群 优化 支持 向 量 机 回归 模型 (Hybrid PSO-SVR)， 使 用 行 离散 化 采样 , 并 使 两 个 参数 满足 a=ao’'(ao > 有 ),b=kaoibs ,可 获 
持 向 量 机 回归 模型 进行 短期 交通 流 预测 ， 并 通过 粒子 群 算法 ”得 离散 小 波 函 数 : 

化 向 量 机 回归 模型 的 参数 ， 减 少 模型 学 习 时 间 。Guo 等 人 Wix (D)=a0 Ty (aoit —kb) 
1 提出 使 用 一 阶 灰色 模型 GM 进行 短期 城市 道路 交通 流 预 再 令 如 =1， 使 Wx(D)=a0 yw(aot-k),ao>1,%keZ ， 若 信号 


测 ， 该 模型 引入 道路 的 负载 和 时 延 因 素 ， 与 原始 灰色 模型 相 f(D)e2(R) ， 则 了 (7) 的 离散 小 波 变换 为 
比 ， 预 测 精度 明显 提高 。 最 小 平方 提升 模型 (least squares 
boosting, LSBOOST) 是 一 个 集成 多 个 学 习 算 法 的 框架 al， 在 
进行 短期 电力 需求 预测 时 ， 具 有 良好 效果 ， 可 尝试 用 于 其 他 ”通常 ，wx(D) 是 一 个 2(R) 上 的 标准 正 交 基 ， 即 
领域 的 短期 预测 。 然 而 ， 如 前 文 所 述 ， 短 期 交通 流 数据 经 党 | 
被 局 部 噪声 破坏 ， 这 可 能 会 显著 影响 短期 交通 流 的 预测 准确 02? 其 他 
性 。 在 先前 的 研究 中 ， 只 关注 了 卡尔 曼 滤波 在 短期 交通 流 预 。 则 ， 信 号 /CD) 可 通过 以 下 方式 重 构 : 

测 中 过 滤 噪 声 的 作用 ,忽视 了 过 滤 噪声 有 损 信 号 质量 ,例如 ， gl i 


Wr (j,k)= [f(Dar p(t —k) adr 


注 


Xie 等 人 0 研究 了 卡尔 曼 滤 波 器 在 离散 小 波 分 析 中 的 应 用 ,得 ei 
出 噪声 污染 会 严重 影响 交通 流 预测 性 能 的 结论 。Wang 等 另外 针对 离散 时 间 信号 的 离散 小 波 变换 可 通过 若干 次 高 


凋 亚 


05 使 用 了 一 种 基于 卡尔 曼 滤 波 器 的 自 适应 交通 流 预测 算法 ，“ 通 和 低 通 滤波 简单 实现 ， 其 中 高 通 滤波 器 获得 高 频 信 息 ， 
该 算法 同时 考虑 了 状态 和 观测 高 斯 噪声 。 为 了 进一步 提高 预 。” 示 信 号 的 细节 , 低 通 滤波 器 获得 低频 信息 ,表示 信号 的 近似 。 
测 精确 度 ，Zhou 等 人 "通过 补偿 初步 预测 的 误差 ， 提出 了 一 ”低频 信息 和 高 频 信息 分 别 通 过 对 应 的 合成 滤波 器 ， 可 以 获得 
种 用 于 交通 流 预测 的 新 型 混合 卡尔 曼 滤 波 器 。 然 而 随 着 过 滤 。 原始 信号 对 应 的 低频 部 分 和 高 频 部 分 ， 再 根据 实际 情况 合成 
噪声 的 能 力 逐 步 地 提升 ， 预 测 精 确 度 趋 于 平稳 ， 甚 至 开始 下 ”所 需 的 部 分 ， 就 可 实现 信号 的 分 解 和 重 构 ， 如 信号 去 噪 、 过 
降 。 主 要 原因 是 ， 在 过 滤 噪 声 的 同时 ， 有 用 的 信号 ， 尤 其 是 。 滤 异 常 值 等 。 


部 分 指示 交通 流 突变 的 细微 线索 也 被 过 滤 掉 了 。 2.2 ”KF 短期 交通 预测 模型 

与 已 有 工作 不 同 的 是 ， 本 文 利用 一 个 新 的 成 本 函数 重新 已 知 ,=[volwsvolmmy…svoln] : 时 刻 t-n 到 时 刻 7 的 一 组 
构造 了 卡尔 曼 滤 波 器 ， 提 出 了 一 种 新 颖 有 效 的 噪声 识别 卡尔 ” ”交通 流 原始 数据 ,在 短期 交通 预测 中 , 预测 目标 值 为 vel : 即 
曼 滤 波 器 OiKF， 该 技术 能 够 在 实现 高 效 噪声 过 滤 的 同时 获 ”预测 下 一 时 刻 上 的 交通 流量 。 在 Zhou 等 人 "先前 的 工作 中 ， 
得 高 质量 有 效 信号 ， 并 将 其 应 用 于 短期 交通 流 预 测 ， 提 出 了 将 要 预测 的 交通 流量 表示 为 过 去 交通 流量 和 相应 权重 
一 种 鲁 棒 交通 流 预测 算法 。 具 体 地 ， 本 文通 过 离散 小 波 变 换 。 ”6,=[9,,9.%…,9, 了 的 组 合 ， 即 : 


(discrete wavelet transform, DWT) 将 原始 交通 流 数 据 分 解 重 构 vol, = H,Q, +v, (1) 
成 近似 部 分 和 细节 部 分 ,与 只 抛弃 细节 部 分 的 Zhou 等 人 中 的 ©,=FO, ,+w, (2) 


工作 相 比 ， 该 方法 能 够 考虑 多 级 细节 部 分 ， 本 文 将 不 同 层次 其 中 Fe Rw 表示 状态 转移 矩阵 ，veR" 和 weR" 为 测量 噪声 
的 细节 部 分 作为 影响 预测 性 能 的 噪声 或 提高 预测 性 能 的 线索 ， 1 过 程 噪声 ， 它 们 均 为 零 均 值 、 不 相关 的 高 斯 白 噪声 ， 分 别 


与 保持 了 原始 交通 流 数据 基础 模式 的 近似 部 分 一 起 作为 模型 有 已 知 的 过 程 噪声 协 方差 矩阵 2 和 测量 噪声 协 方差 矩阵 R 。 
的 输入 来 求解 下 一 时 刻 的 最 优 解 ， 同 时 还 利用 历史 参考 点 对 且 获 得 vol ， 所 求 下 一 时 刻 t+7 的 交通 流 预 测 值 vo 可 表 
预测 值 进行 修正 ， 从 而 提高 了 预测 的 准确 性 。 示 为 


可 其 A 预测 -人 卉 刑 也 呈 拉 vol = H,,©, (3) 
2 ”OiKF 短期 交通 预测 理论 模型 及 实现 @ 是 结合 式 (1) 和 (2) 得 到 的 时 刻 t 最 优 估计 值 。Lan 等 人 

在 理论 模型 中 ， 首 先 利 用 离散 小 波 变换 对 异常 值 进行 过 。 II、Xie 等 人 04 和 Zhou 等 人 中 的 工作 也 做 了 相同 的 假设 。 
滤 处 理 ， 然 后 分 析 卡 尔 曼 滤波 器 (KE) 进 行 交通 流 预 测 的 通用 ”2.3 ”OIKF 短期 交通 预测 模型 


方法 ， 最 后 提出 基于 异常 值 识 别 卡 尔 曼 滤 波 器 (OiKF) 及 其 理 OiKF 短期 交通 预测 模型 中 , 利用 离散 小 波 变换 对 交通 流 
论 模型 , 并 叙述 利用 该 理论 模型 实现 短 时 交通 流 预测 的 过 程 。 ”原始 数据 vol eH 进行 分 解 重 构 ， 最 终 由 两 部 分 组 成 : 近似 部 
2.1 离散 小 波 变换 对 异常 值 的 处 理 分 互 ( 记 =Dooororol ) 和 细节 部 分 A 

小 波 变换 (wavelettransform, WT) 是 通过 伸缩 和 平移 对 信 (A =[44m45])。 其 基本 原理 为 : 由 于 异常 值 (存在 高 度 


号 进行 细 化 分 析 的 工具 ,能 提供 变化 的 时间- 频率 ”窗口 09。 不 确定 性 : 气候 、 交 通 事 故 、 突 发 事件 等 因素 在 原始 数据 流 
设 函 数 Y(D) 是 一 个 平方 可 积 的 函数 ， 即 w(D)sZ(R) ， 且 该 函 。 ”中 产生 的 异常 值 ) 的 存在 , 原始 交通 流 数据 被 局 部 存在 的 异常 
数 的 傅 里 叶 变 换 为 值 /噪声 严重 破坏 ， 为 解决 该 问题 ， 通 过 离散 小 波 变换 ， 以 分 
坚 重 构 获得 的 低频 近似 部 分 vox 替代 原始 数据 vox 作为 系统 
的 部 分 输入 用 于 交通 流 预测 ， 实 现在 对 原始 数据 过 滤 由 不 确 


:oy 


(0)= fy (Wemar 
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定性 产生 的 异常 值 ， 同 时 还 保持 了 原始 交通 流 的 基础 模式 ; 


为 不 丢失 原始 数据 中 指示 交通 流 突 变 的 细 
节 部 分 ^, 作为 被 异常 值 所 


分 一 一 高 频 细 


量 ， 去 捕获 隐 含 在 快 


构 的 基础 上 ， 实 现 扩 展 卡 尔 曼 滤 波 器 ， 则 


示 为 


其 中 Be Rw 是 控制 矩 


中 交通 流 权 重 8,, 将 
表示 为 


其 中 &eR" 表 示 协 方差 为 o? 的 高 斯 


微 线索 ， 以 另 一 部 
破坏 的 控制 输入 变 


速 随 机 变化 的 交通 情况 中 的 细微 线索 。 
在 离散 小 波 变换 对 交通 流 原始 数据 vol eH, 进行 分 解 重 


动态 线性 系统 可 表 


©, =FO +BA,,+w, 
vol, = H,QO, +v, 


其 重新 表示 为 6, 。 细 


Al =A + 


(4) 
(5) 


阵 ， 其 作用 与 类似。 为 了 区 别 于 式 (2) 


节 部 分 A, 可 被 重新 


(6) 


噪 j 


。 通 过 扩展 ， 该 技 


术 既 继承 了 传统 卡尔 曼 滤 波 过 滤 品 声 的 所 有 优点 ， 又 保证 了 


原始 数据 的 质量 。 
在 预测 模型 中 ， 其 目标 成 本 函数 为 


E(vol,)= Cov(e?, +e2n +...+e2)—oK,? 


问题 求解 : 利 


其 中 : E(vol) 表示 时 刻 上 求解 获得 的 优化 


(7) 


公式 (7) 所 示 的 成 本 函数 去 求解 最 优 解 。 


标 ， Cov 运算 表示 


每 个 时 刻 i 的 估计 误差 的 平方 组 成 的 协 


是 卡尔 曼 增益 矩阵 。 


和 相应 协 方差 矩阵 ， 


计 值 ) 和 相应 协 方差 矩阵 驴 ， 在 得 至 


由 于 篇 幅 问 题 ， 


的 权重 62 和 误差 


从 而 获得 其 


通 流 预测 值 vo1 可 通过 公式 (3) 进 行 计算 。 
时 刻 的 输入 ( 先 验 估计 ) 用 来 计算 下 一 次 的 最 优 估计 ， 这 是 一 
个 动态 滚动 的 持续 预测 过 程 。 


此 尹 


， 通 过 对 实 


数据 本 质 上 具有 一 定 


中 , 先 选取 时 间 


序列 高 宇 [vols,volsn,...,voln | | 3| 


推导 优化 公式 (7) 的 详细 
过 程 可 参考 Zhang 等 人 四, Ma 等 人 151 的 相关 工作 。 本 文 给 出 
了 该 算法 的 基本 过 程 : 
首先 基于 t-7 时 刻 
一 个 先 验 的 估计 值 67 以 及 相应 的 误差 协 方差 矩阵 P-。 
用 求 得 的 卡尔 曼 增 益 久 


值 对 预测 值 进行 修正 。 
ks 个 时 间 点 的 数据 作为 当前 


方差 秆 阵 ，K, eR 


协 方差 矩阵 所 得 到 
然后 


E 阵 K, 和 测量 值 vo 去 更 新 估计 值 65 
后 验 估计 6@; (所 求 的 最 优 估 
I 最 优 估计 值 后 , 所 求 的 交 


最 后 @i 和 PR 下 一 


际 数据 的 波形 图 进行 分 析 ， 可 知 交通 流 
的 周期 性 。 因 此 ， 历 史 数 据 具有 很 好 的 
参考 价值 。 在 进行 预测 时 , 首先 通过 公式 (3) 获 取 时 间 1 的 预测 
值 vol, , 然后 通过 历史 参考 
1 之 前 一 段 时 间 


在 近似 部 分 


Sh =[vol. VOLN-sH -vol | 


搜寻 与 当前 实际 交通 流 数据 


从 已 预测 获得 的 历史 数据 序列 中 
这 列 最 为 接近 的 历史 序列 


选取 时 间 观测 值 vou 作为 参考 值 ， 预 


所 示 。 


测 值 修正 过 程 如 图 1 
并 hh 
下 | | 由 
"| 


图 1 卡尔 曼 滤 波 器 的 预测 值 i 
The correction process of prediction value of Kalman filter 


F 均 ， 得 到 最 终 的 预测 值 vo1, ， 设 参考 值 


Fig. 1 
vol 与 vol, 进行 加 权 


行 修 


的 权重 为 weight ， 


vol: = weight xvol, 十 ( 


其 计算 公式 可 定义 为 


—weight)xvol, (8) 


基于 异常 值 识别 卡 尔 曼 滤波 器 短 


正 处 理 过 程 


期 交通 预测 基本 过 程 为 


算法 1 基于 异常 值 识 别 卡 尔 曼 滤波 器 算法 步 又 


1. 初始 化 阶段 : 
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1.1 设置 状态 转移 矩阵 FF, 控制 矩阵 B ,过 程 噪声 的 协 方差 矩阵 2 ， 
测量 噪声 的 协 方差 矩阵 R 和 细节 部 分 的 噪声 方差 o? 。 
1.2 初始 化 瓦 , 状态 协 方差 矩阵 PB, ， 权 重 @, 和 细节 部 分 Au 的 值 。 


2. 预测 阶段 : 
©; = FO: + BA,, 
P- 


=FPiFT +oBB"+O 


3 
K,=P-H’' (HP Hr +R-o) 


-1 


; = Or + K, (vol, -H.,©7) 


P+=(I-KH,)P- 


vol, = ,0,+R 

4. 修正 阶段 : 

搜寻 最 相似 的 历史 序列 ， 获 得 历史 参考 值 vol, ， 根 据 公 式 (8) 与 第 3 阶 
段 获得 的 预测 值 vol', 进行 加 权 平 均 ， 得 到 最 终 的 预测 值 vor, 。 

5. 壕 代 : 重复 阶段 2~4 直到 预测 完毕 。 


3 ”实验 及 结果 对 比分 析 


3.1 实验 数据 说 明 
实验 中 采用 了 常 被 用 作 基 准 的 测试 数据 一 一 荷兰 阿 姆 斯 


特 丹 的 四 条 高 速 公路 的 交通 流 


地 谤 


数据 (分 别 表 示 为 Al1、A2、 


A4 和 A8)[45,7,8,15,19], 对 本 文 提出 的 OiKF 进行 验证 性 实验 。 


这 四 条 高 速 公路 终止 于 阿 姆 斯 特 
对 应 的 分 布 如 图 2 所 示 ， 其 数据 是 通过 分 别 位 于 距离 环 路 融 
合 点 附近 的 一 段 距 离 内 的 MONICA 传感器 的 四 个 检测 点 收 
集 获 得 。 数 据 序列 为 : 从 2010 年 5 月 20 


斗 的 环 路 , 即 A10 高 速 公 路 ， 


至 2010 年 6 


量 ， 


24 日 ， 每 分 钟 进行 一 次 统计 ， 统 计 该 分 钟 内 所 经 过 的 车 辆 数 


三 


里 。 


图 2 荷兰 阿 姆 斯 


特 丹 的 A1、A2 等 四 条 高 速 公路 分 布 图 


Fig.2 The map ofthe four highways in Amsterdam 


这 四 条 高 速 路 具有 一 定 的 代表 性 ， 其 中 


a) Al 为 边境 高 速 ,是 欧洲 第 一 条 高 占有 率 3+ 分 离 车 道 ， 


车 道 占 有 率 瞬 时 变化 较 大 ， 预 测 难度 高 。 


b) A2 为 荷兰 境 


内 最 繁忙 的 高 速 公路 之 一 ， 其 拥堵 情况 


变化 大 ， 


] 以 验证 预测 模型 应 对 交通 拥塞 的 预测 有 效 性 。 


以 验证 交通 突 发 情况 的 预测 有 效 性 。 


c)A4 
缓和 正常 。 
d) A8 
3.2 实验 设置 说 明 


在 实验 中 , 令 状 
1 ， 即 =7 ; 控制 矩 


高 速 公 路 是 境内 标准 的 匡 


高 速 公 路 是 一 段 长 约 10 


家 公路 , 其 车 流 情况 比较 


公里 左右 的 接 驶 性 公路 ， 


态 转移 矩阵 下 的 初始 值 设置 为 单位 矩阵 
阵 初始 设置 为 105.7 即 B=105.7 ; 矩阵 


大 小 nn 设置 为 8。 测 量 


异常 值 的 协 方差 矩阵 R 设置 为 零 矩 阵 ， 


初始 状态 协 方差 矩阵 只 和 过 程 异 常 值 的 协 方差 矩阵 2 设置 


为 10*.7 。 令 初始 权重 9, 设置 为 | 


换 操作 时 ， 本 文选 择 
历史 参考 值 时 ， 


1 


并 | 。 另 外 在 离散 小 波 变 


Daubechies 1 和 Haar 作为 母 波 。 在 搜索 
经 过 实验 验证 ， 按 一 天 时 间 


202009.00079v1 


chinaXiv 


白 伟 华 


( 24x60min=144x10min ) 进 行 切 分 的 数据 序列 相关 性 最 高 ， 因 此 


为 0.2。 


将 序列 的 长 度 * 设 


为 144， 历 史 参 考点 的 权重 weight 的 值 设 


3.3 实验 评价 准则 


在 实验 中 ， 拟 定 预 测 效果 评估 准 
方 根 误差 (root mean square error, RMSE) 用 于 衡量 


则 为 芍 ， 5,7, 8,14,19~23]. : 均 


个 模型 的 


预测 值 和 系统 的 测量 值 之 间 的 平均 误差 ;平均 绝对 百分比 误 
差 (mean absolute percentage error，MAPE) 是 这 个 平均 误差 的 


百分比 表示 。 其 定义 为 
让 2 
RMSE = (vor vot) (9) 
MAPE = $l vo 100% (10) 
M 和 气 VOL 
其 中 M 表示 数据 集 的 大 小 ，vol, 和 vol 分 别 为 时 刻 上 的 预测 值 
和 真实 值 。 
3.4 预测 结果 及 分 析 
实验 采用 OiKF 对 数据 集 进行 测试 。 图 3(a)-(d) 为 针对 Al， 
A2,，A4, A8 四 条 公路 交通 流量 数据 其 中 1000 个 点 的 预测 结 
果 。 图 中 黑色 实 线 为 预测 值 ， 红 色 虚 线 为 实际 观测 值 。 图 4- 
7 为 对 应 A1，A2，A4，A8 四 条 公路 交通 流量 5000 个 点 的 
预测 值 与 实际 观测 值 的 相关 误差 频 度 及 CDF 图 , 由 观测 值 与 
预测 值 的 差 值 取 绝 对 值 并 除 以 观测 值 获得 。 
实验 数据 集 考虑 了 多 种 影响 因素 及 环境 下 的 交通 流 数 据 ， 
如 图 3 所 示 ， 预 测 曲线 与 实际 观测 值 曲线 的 拟 合 度 高 ， 即 使 
在 数据 突变 的 位 置 误差 也 比较 小 。 由 此 可 见 本 文 提出 的 方法 
克服 了 传统 卡尔 曼 滤 波 器 的 不 足 ， 有 效 地 捕捉 到 指示 交通 流 
突变 的 细微 线索 ， 能 准确 地 对 短 时 交通 流 进行 预测 。 
图 4~7 中 ,x 轴 表 示 误 差 区 间 ， 左 边 y 轴 表 示 5000 个 预 
测 点 中 误差 a 落 入 对 应 区 间 的 数量 ( 频 度 )， 右 边 y 轴 表 
示 误 差 累积 ， 柱状 图 为 频 度 ， 线 为 CDF。 
coo 2 A | 
蔓 | | M Mm ph VY | Wh | l 
| | | 
a vy VY VY 是 W W UV 
(a) Al 预测 值 与 实际 观测 值 拟 合 曲 线 
0] | CORE 人 | 
4 一 请 参 WA fe 
A 时 9 时 二 
ooo] | | \ | | 
| V WU UV VY VY W 
(b) A2 预测 值 与 实际 观测 值 拟 合 曲 线 
5000 -| | et 
Pee, A Ne h | 
ENNA MM MA 
oN 
,| 记 网 \U W VU | 
(c) A4 预测 值 与 实际 观测 值 拟 合 曲 线 
1 An 区 | 凡 ] 
| | | 
重 A Ff A Ny | 
we 人 VAN | | | | 1 | 
这 由 | 
(d) A8 预测 j 值 与 实际 观测 值 拟 合 曲线 
图 3 四 条 高 速 公 路 交通 流量 预测 值 与 实际 观测 值 拟 合 曲线 图 


Fig.3 The curve ofthe predictions and actual values 
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Fig. 5 
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| 


4 Al 预测 误差 值 频 度 及 误差 CDF 


The prediction error frequency and error CDF of Al 


T 100.00% 


| 80.00% 


上 60.00% 


上 40.00% 


上 20.00% 
+ 0.00% 


| 


5 ”A2 预测 误差 值 频 度 及 误差 CDF 


The prediction error frequency and error CDF of A2 


wD TN Tm ov rnoa 
ee 0 Pp 3 
S SS SoS SoSS 


100.00% 
80.00% 
60.00% 
40.005% 
20.0036 
0.00% 


入 | 0.08 


6 A4 预测 误差 值 频 度 及 误差 CDF 


The prediction error frequency and error CDF of A4 


rrrr 
om 
S 


0.88] 
0.96 


wm ww TN Tw ow toa 
和 
SSSsS 3 


100.00% 


图 7 Ag 预测 误差 值 频 度 及 误差 CDF 


Fig.7 The prediction error frequency and error CDF of A8 


通过 分 析 5000 个 数据 点 预测 误差 落 入 的 


区 间 频 度 和 累 


积 CDF 曲线 ，a) 由 图 4 得 到 : 对 Al 预测 ， 误 差 在 [0,0.2] 累 
积 达 到 90.36%， 误 差 <0.3 累积 达到 96.39%; b) 对 于 A2， 


图 5 可 知 : 预测 误差 在 [0,0.2] 累 积 达到 92.03%， 误 差 <0.3 累 


积 达 到 96.55%; c) 图 


6 可 知 ， 对 于 A4 的 交通 预测 ， 


积 达 到 88.56%， 误 差 <0.4 累积 达到 95.95%; qd) 


[0,0.2] 累 
图 7 所 示 ， 


[0,0.2] 累 积 达 到 89.10%, 误差 <0.4 累积 达到 95.45%。 所 有 的 


预测 中 , 误差 <=0.2 都 超过 了 90%, 证 明了 OiKF 能 准确 地 对 
短 时 交通 流 进行 预测 。 
3.5 预测 准确 性 对 比分 析 

为 验证 OiKF 模型 在 整体 预测 的 有 效 性 ， 以 同一 数据 集 
(荷兰 阿姆斯特丹 的 四 条 高 速 公路 的 交通 流量 数据 ) 为 输入 ， 


将 本 文 提出 的 OiKF 
5 以 及 当前 
价 准则 一 一 式 (8)(9) 的 


预测 
些 新 提出 的 交通 流 预 测 模型 
MAPE/RMSE 进行 


者 果 数 据 与 传统 的 卡尔 曼 滤波 模型 
的 实验 结果 按 记 
准确 性 


翌 


苹 


对 比分 析 。 


9 


a 


有 代表 性 的 对 比 算法 有 : 
) 混合 粒子 群 优化 支持 向 量 机 下 


归 模 型 


算法 (hybrid 


particle Swarm optimization support vector regression method， 


C 


(random walk method，RW)、 历 史 平 均 模 型 
model, HA)、 基 于 机 器 学 习 的 最 小 平方 
ing, LSBOOST), 


boosti 


灰色 模型 算法 (grey model，GMD)ID]; 
) 常用 的 标准 基线 对 照 模型 算法 P29; 


随机 游 走 模 型 
型 (historical average 
是 升 模型 (least squares 
一 个 简单 模型 的 集成 框架 03 和 指数 平 
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滑 模型 (exponential smoothing model，ES); 


d) 当前 一 些 新 的 丰 


究 成 果 的 模型 算法 : 自动 
法 (autoregression，AR)[ 和 、 混 合式 双 卡 尔 曼 滤波 模型 (hybrid 
dual Kalman filtering model, KF)[251、\ 
(hybrid learning based model, SVRGSA 以 及 SVRPSO) 
各 类 算法 的 MAPE 和 RMSE 实验 结果 数 


I 


和 2 所 示 ， 最 后 本 文 还 分 析 了 OiKF 对 比 各 类 算法 在 有 效 性 


归 模 型 算 


基于 混合 学 习 的 模型 


19], 


员 分 别 如 表 1 


上 的 提升 率 。 

表 1 本 方法 和 当前 各 类 预测 模型 的 MAPE 实验 结果 对 比 
Tab. 1 The comparison of MAPE with other models 
model Al A2 A4 Ag 

SVR 14.34 12.22 12.23 12.48 
GM 12.55 10.88 13.28 12.92 
RW 12.65 11.43 12.06 12.37 
HA 16.87 15.53 16.72 16.24 
LSBOOST 13.78 14.43 12.90 14.00 
ES 11.94 10.75 11:97 12.00 
AR 13.57 11.59 12.70 12.71 
KF 12.46 10.72 12.62 12.63 
SVRGSA 11:1§ 9.42 10.65 11.81 
SVRPSO 11.63 10.08 10.99 12.20 
OiKF 8.57 7.93 10.61 11.56 


表 2 本 方法 和 常 


预测 方法 的 RMSE 实验 结果 对 比 


Tab.2 The comparison of RMSE with other models 


model Al A2 A4 A8 
SVR 329.09 259.74 253.66 190.30 
GM 348.38 255.86 274.48 188.97 
RW 312.92 223.82 230.01 174.14 
HA 404.84 348.96 357.85 218.72 
LSBOOST 306.33 233.88 229.78 177.52 
ES 315.82 226.40 237.76 174.67 
AR 301.44 214.22 226.12 166.71 
KF 332.03 239.87 250.51 187.48 
SVRGSA 284.97 192.68 213.69 161.07 
SVRPSO 300.97 205.94 224.63 163.95 
OiKF 203.34 154.98 184.96 132.41 

从 表 1 和 2 可 以 得 出 ， 本 文 提 出 的 方法 在 四 个 基准 数据 


浪 


a 比 弄 


他 的 对 照 方法 更 准确 ，OiKF 在 MAPE 和 RMSE 
的 实验 结果 中 都 取得 了 最 佳 效果 ， 与 其 他 各 个 模型 算法 预测 


在 RMSE 的 4*12 组 的 预测 


基于 异常 值 识别 卡尔 曼 滤波 器 的 短期 交通 流 预测 


ChinaXiv 合 作 期 刊 


第 38 卷 第 3 期 


结果 数据 对 比分 析 得 到 , OiKF 所 
获得 的 效果 也 是 最 好 的 ,从 图 9 中 Impove-Avg 项 数据 可 知 ， 


OiKF 的 RMSE 值 整体 上 比 其 他 模型 相应 地 平均 分 别 降低 了 
120.339，85.157，64.889 和 47.943 。 
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图 9 与 其 他 模型 RMSE 值 降低 值 对 比 


Fig.9 The comparison of RMSE improving with others model 


提升 


OiKF 在 


MAPE 降低 值 
[= 


Al A2 
图 10 各 路 线 预测 MAPE 降低 值 分 布 情况 


四 条 高 速 路 上 预测 结果 的 MAPE 和 RMSE 整体 
情况 (与 其 他 模型 对 比 ，MAPE 降低 值 与 RMSE 减少 值 
的 分 布 图 ) 对 应 的 箱 图 如 图 


10 和 11 所 示 。 


A4 


A8 


Fig. 10 The distribution of MAPE improving values 
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Fig. 11 


通过 对 实验 结果 的 比较 分 书 


图 11 各 路 线 预测 RMSE 减少 值 分 布 情况 
The distribution of RMSE improving values 
打 ， 实 验 数据 呈现 出 本 文 提 出 


结果 在 MAPE 和 RMSE 上 的 效果 提升 情况 如 图 8 和 9 所 示 。 的 预测 模型 比 其 他 常用 模型 的 优越 性 ， 也 充分 证 明了 本 文 提 
和 本 出 的 方法 在 解决 短期 交通 流 预测 问题 中 的 有 效 性 。 
&7 | Semw 4 ”模型 应 用 实例 
6 四 vsHA 
证 | i 在 解决 公交 企业 目前 普遍 存在 的 “分 散 调度 ”“ 静 态 调 
Sl van 度 ” “经 验 调度 ”， 引 起 的 投入 高 、 反 应 慢 、 效 益 差 、 客 源流 
=7 a 失 严 重 的 问题 时 ， 将 基于 异常 值 识 别 卡 尔 曼 滤波 器 的 短期 交 
0 了 Re 通 流 预测 模型 幅 入 在 公交 智能 调度 系统 中 ， 对 特殊 路 段 进行 
短期 交通 流量 预测 ， 以 动态 调整 公交 调度 的 需求 ， 提 高 公交 
图 8 与 其 他 模型 在 MAPE 上 的 误差 降低 对 比 运营 调度 管理 的 智能 化 ， 实 现 公交 企业 对 人 、 车 、 线 路 等 资 
Fig.8 The comparison of MAPE improving with others model 源 的 高 效 利 用 。 图 12 为 系统 中 公交 调度 与 GIS 整合 的 场景 ， 
由 图 8 可 知 ，OiKF 模型 在 A1、A2、A4 和 Ag 四 条 高 速 其 中 利用 OiKF 对 地 图 中 的 多 条 主要 路 径 进 行 交通 流量 预测 ， 
公路 的 测量 点 的 预测 值 所 获得 的 MAPE 是 最 好 的 。 图 8 中 ”并 反馈 到 公交 的 实时 调度 中 。 
Impvoe-Avg 项 统计 出 OiKF 模型 在 各 条 高 速 路 上 对 比 其 他 预 本 文 提 出 的 OiKF 模型 测试 应 用 在 2019 年 工业 和 信息 化 
测 模型 的 MAPE 的 平均 降低 百分率 ， 故 由 图 8 可 知 , 本文 所 ”部 新 型 信息 消费 示范 项 目 “ 桂 林 出 行 网 一 一 运输 服务 与 旅游 
提出 的 预测 模型 比 其 他 最 新 研究 提出 的 预测 模型 (如 AR， 融合 数字 经 济 服务 平台 ”的 公交 智能 调度 系统 中 ， 分 别 在 桂 
SVRGSA，SVRPSO 等 )， 其 误差 在 四 条 高 速 路 的 预测 值 误 差 ” 林 市 的 环 城北 一 路 、 环 城北 二 路 、 中 山北 路 、 东 二 环 路 和 建 
平均 分 别 降 低 了 达到 : 4.524%，3.775% ，2.002% 和 1.376%。 干 路 五 条 干道 (如 图 12 所 标注 的 五 条 城市 干道 ) 上 设置 了 
分 析 图 9 可 知 ,与 常用 及 当前 最 新 研究 的 预测 模型 比较 ， 1000 个 预测 点 ， 以 对 OiKF 进行 有 效 性 验证 测试 ， 并 获得 了 
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良好 的 运营 效果 。 将 前 期 预测 情况 反馈 给 调度 系统 ， 以 预案 
有 效 地 指挥 、 控 制 和 调节 车 辆 运行 ， 均 匀 合 理 的 行车 间隔 ， 
营运 车 辆 跨 线路 营运 ， 并 可 用 于 回顾 总 结 分 析 ， 实 现 调度 业 
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图 12 ”OiKF 应 用 实例 场景 图 
Fig. 12 Oikf in the bus intelligent dispatching system 


5 ”结束 语 


本 文 提出 了 一 种 新 的 短 时 交通 流 预测 方法 ， 用 于 改善 短 
期 交通 流 预 测 的 准确 性 ,该 方法 改善 了 传统 的 卡尔 曼 滤波 器 ， 
使 其 能 对 异常 值 进行 识别 和 过 滤 。 通 过 实验 ， 与 当前 研究 成 
果 提 出 的 模型 的 对 比 以 及 在 公交 智能 调度 系统 中 的 测试 应 用 ， 
实验 结果 证 明了 该 方法 有 效 性 和 优越 性 ， 也 说 明 在 进行 短期 
交通 流 预测 时 ， 过 滤 异 常 值 的 同时 保证 原始 数据 的 质量 是 必 
要 的 。 在 四 个 基准 数据 集 上 的 大 量 实验 表明 ， 与 常用 及 最 新 
的 预测 模型 相 比 ， 其 结果 MAPE 平均 降低 了 2.919%, RMSE 
平均 降低 了 79.582。 在 今后 的 研究 中 ， 将 进一步 研究 扩展 到 
其 他 卡尔 曼 滤 波 器 中 ， 如 扩展 卡尔 曼 滤 波 器 或 无 迹 卡 尔 曼 滤 
波 器 ， 并 将 其 应 用 于 其 他 预测 任务 中 ， 如 服务 器 任务 序列 的 
分 析 和 预测 ， 云 计算 中 心 各 类 资源 利用 率 预 测 和 分 析 ， 以 及 
小 粒度 任务 调度 或 任务 量 随时 间 变 化 预测 等 。 结 合 神经 网 络 
的 应 用 和 一 些 新 的 交通 流 短期 预测 模型 的 成 果 PR62 引 ,将 进 一 
步 优化 OiKF 模型 的 参数 设置 ， 以 提高 预测 模型 的 准确 性 。 
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